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CAPÍTULO VI 


y MODELO METODOLÓGICO 
PARA CONSTRUIR TESAUROS 


A qIIA4<q([lz 


Bs — —É—É— 
6.1 Características del modelo 


Una vez definidos los elementos y características 
principales del tesauro se aborda la propuesta de un modelo para construirlo, 
como herramienta de indización y recuperación de documentos digitales y 
multimedia. Para ello, el tesauro se percibe como un subsistema en un sistema 
de referencias bibliográficas o de texto completo, que interactúa en forma 
más estrecha que el lenguaje natural (sin menoscabar éste como una opción 
de búsqueda) con el documento impreso, digital y multimedia. En efecto, el 
tesauro y los documentos del sistema deben estar estrechamente relacionados 
de cara a la recuperación de temáticas si deseamos facilitar el acceso y el uso 
a la información. Como se ha venido delimitando desde el principio del 
presente trabajo, el enfoque estará restringido a productos informativos 
visuales, auditivos y textuales con un propósito académico. Por tanto, quedan 
excluidas del estudio entidades informativas relacionadas con el 
entretenimiento o estructuras administrativas institucionales, cuyas 


características pueden requerir variaciones en el modelo. 
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| ` Mediante un modelo se buscan extraer los elementos, mecanismos 0 
| procedimientos que contribuyan a asociar los componentes para obtener un 
| sistema que solucione un problema real. La construcción de un tesauro es 
una tarea que debe mejorarse y la observación de los producidos en los 
- últimos años permite diagnosticar que, mediante la aplicación de ciertos 
procedimientos, es posible aumentar la eficiencia y la oportunidad. El proceso 
de construcción de un tesauro debe ser estructurado para convertir su 
construcción en una tarea entendible, fácil y sencilla de aplicar. 
' El tesauro es un sistema de tipo humano diseñado por el hombre y cumple 
una función orientada a satisfacer la necesidad de organizar información 
temática. Como sistema humano ofrece la posibilidad de transformar y predecir 





la manera de interactuar entre sus componentes, para obtener los resultados 


esperados. Las debilidades del proceso de construcción de tesauros crean 
una contradicción entre lo observado hasta el presente y los objetivos de 


celeridad y efectividad a los que se aspira para el futuro. 
Se pretende que el modelo que se presenta sea útil para crear, corregir, 


mejorar, expandir o contraer un tesauro existente. 





6.2 Secciones del tesauro 


En los capítulos anteriores se explicaron varios 
aspectos relacionados con el tesauro, resumidas en las constantes y las 
variables que lo definen, y se estudiaron los elementos que lo componen en 
detalle, pero hace falta una visión más globalizadora de la herramienta 
lingüística. En las normas ISO 2788 se detallan cada uno de los elementos 
del tesauro y en el capítulo cinco se aplicó una visión propia a cada uno de 
ellos. Sin embargo, en el tesauro se organizan secciones que agrupan los 
elementos anteriores. Los componentes de esas secciones responden a un 
esquema básico que otorga significado al corpus o texto terminológico y a 
los índices, en la introducción se explica tanto el esquema como sus contenidos. 
El tesauro puede incluir, además, esquemas gráficos de las relaciones, listas 
de equivalencias a otros idiomas y listas de identificadores. La presentación 
del tesauro puede ser impresa o en pantalla como parte del sistema de 
información en el que se inserta, pero debe ofrecer los mismos servicios en 
los dos casos. Cada vez es más frecuente la presentación en pantalla, pero 
también es habitual que por lo menos la primera versión se edite. 
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labras que integran los descriptores. Se ordenan las palabras 
tinúa el orden con las letras subsiguientes. Es un 
de un texto, en el cual la palabra de orden o de 
entrada figura en el centro de una línea rodeada a derecha e izquierda de las 
mismas palabras que la acompañan en el texto. El índice KWIC significa key 
words in context y el índice KWOC key words out of context. Es decir, en el 
primero se hace una lista de los términos de indización con cada una de las 
palabras que lo integran, alfabetizadas en una columna central de la hoja, 
pero se conservan las otras palabras que lo acompañan en el texto a derecha 
e izquierda. En el KWOC las palabras se van ordenando en una columna y en 
otra columna de la misma fila se coloca el descriptor completo.*2 

Tanto el corpus alfabético como los índices son las primeras secciones 
concluidas, pero, antes de presentar esas estructuras al usuario final, se 
deben explicar una serie de aspectos para aprovechar la herramienta en toda 
su capacidad. Como se sabe, el tesauro se construye para un sistema de 
información en particular, pero su utilidad puede extenderse a otros sistemas 
de información y el lector que analice un tesauro para aplicarlo en un entorno 
diferente necesita datos que no son evidentes o fácilmente detectables en el 
índices. Después de la experiencia de análisis y evaluación de varios 
tesauros, se observó la necesidad de elaborar un trabajo comparativo a detalle 
de dos tesauros y se escogieron, para ello, tesauros del ámbito de la 
Bibliotecología. Se concluyó que las introducciones son a veces insuficientes 
para obtener un panorama de la herramienta que se ofrece. 

Como corolario del mencionado estudio comparativo de tesauros, se 
observa que, si bien están constituidos fundamentalmente por el corpus y 
los índices, en su introducción se olvida incorporar muchos de los datos que 
son imprescindibles para usar la herramienta.? Por lo tanto, se propone un 
contenido para la introducción de cualquier tesauro que brinde cohesión al 
trabajo e información imprescindible para el observador externo: 


una de las pa 
or las letras iniciales y con 


índice que lista las palabras 


corpus e 


290. CLEVELAND, Donald y Ana D. CLEVELAND. 1990. Introduction to indexing and abstracting. 


2nd ed. Englewood, Col.: Libraries Unlimited. p. 64. 
291. NAUMIS PEÑA, Catalina. 2006. “Tratamiento terminológico de la bibliotecología en tesauros 


de la especialidad”. En: Investigación Bibliotecológica: archivonomía, blbliotecología e información, 
jul.-dic., vol. 20, N° 41. (En prensa). 
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res de autores, personajes, instituciones, lugares, con los 
las diferentes variaciones de un nombre. Se 


po de autoridades. 


nomb 
correspondientes envíos a 


construye una lista para cada gru 


6.3 Propuesta general para construir un tesauro 
Después de la revisión en el capítulo anterior de la 


tesauros, se concluyó que el método inductivo O 
dos son adecuadas para ello, pero cada tesauro 
de uso y el modo de trabajo se debe definir 
de acuerdo a Sus particularidades. Por lo tanto, una vez decidida la construcción 
del tesauro se distinguen tres etapas para desarrollarlo, que permiten organizar 
el trabajo y no olvidar ninguno de los aspectos a tener en cuenta en el proceso 
de construcción. Cada una de las etapas agrupan una serie de pasos a seguir: 
etapa de recolección, etapa conceptual y etapa de evaluación. 


metodología para construir 
deductivo o la mezcla de tos 
debe ser estudiado en el contexto 


a) Etapa de recolección 
4. Identificación y evaluación de las áreas del conocimiento para incluir 
en el tesauro. 
>. Definición de los usuarios del sistem 
3. Análisis de las representaciones de cont 
o de la biblioteca digital del sistema 
usada para marcar y recuperar contenidos. 
4. Evaluación y análisis de tesauros en la temática general o específica 
del sistema de información. 
5. Definición de los objetivos del tesauro. 
6. Elección de una metodología para desarrollar el tesauro. 
7. Establecimiento de criterios para seleccionar los términos a 
incorporarse al tesauro. 
3. Selección del software para soportar el tesauro. 
9. Presentación del proyecto de trabajo para desarrollar el tesauro. 
10. Integración de un inventario primario de términos significativos 
para indizar y recuperar en Una especialidad y dentro de un sistema 


de información en particular. 
11. Evaluación de los términos inclui 


a de información. 
enido del registro bibliográfico 
de información y la práctica 


dos en el inventario terminológico. 
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6.4 
La primera etapa del proceso es la de recolección, que 
das en el diagrama de 


lleva implícita algunas de las actividades ya especifica 
flujo anterior. Sin embargo, para la descripción de cada uno de los tres procesos 


se analizarán las tareas implícitas en términos generales, a fin de no quitar la 
continuidad que en realidad, conlleva la construcción de un tesauro. 


6.4.1 Definición del tema de trabajo, usuarios, 
características de las representaciones de 
contenido y valoración de tesauros existentes 
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293 


lizadas tiene un efecto de familiarización con 


La lectura de fuentes especia 
u ámbito, permitiendo 


rminología y el significado que exhiben en S 
| nificado estable. 

á también estrechamente vinculada a los 
destinatarios que consuttarán el sistema de información. Los usuarios serán 

el objetivo primordial del sistema de información y, por lo tanto, es necesario 
tomar conocimiento de sus necesidades y expectativas, estudio que en esta 
etapa podrá hacerse a través de la lectura sobre el diseño del sistema en 
conjunto o, si no existe un documento que lo acredite, se consultará a los 
implicados en la organización general del sistema de información. 

La concreción del tema y del perfil de los usuarios serán, además, el 
producto de la aplicación de entrevistas al equipo de diseño y/o de trabajo 
del sistema de información y/o a las autoridades responsables de la institución 
que respalda la base de datos o biblioteca digital. Las entrevistas deberán 
planearse por el desarrollador del tesauro con posterioridad a la lectura 
sobre información de la temática y el ejercicio de indización para no llegar sin 
una preparación previa que plantearía una desventaja, porque no aprovecharía 
las entrevistas en toda su capacidad. Las técnicas de la entrevista como 
proceso científico para obtener elementos metodológicos, pueden ser 
consultadas en la obra de Ketele.2 

Se deben tener en cuenta, además, los enfoques posibles del mismo 
tema para contrastar el lenguaje de la especialidad, y sobre todo entender 
el hecho de que los propios interesados pueden tener solamente alguno O 
algunos de ellos desconociendo los demás. La indización de algunos 
documentos de los que ingresarán a la base para observar y comparar la 
definición y las características de la temática planteadas hasta ese momento, 
otorgarán una visión más detallada del tema y los subtemas de la materia 


de estudio. 
Una vez lograda | 
el tesauro, los usuarios y las características 


reconocer términos con un sig 
La definición de la temática est 


a definición de la especialidad sobre la que se construye 
del sistema de información, se 


293. CARDERO GARCÍA, Ana María. 2003. Terminología y procesamiento. Prólogo de M. Teresa 
Cabré. México: UNAM, ENEP Acatlán. p. 43- 
294. KETELE, Jean-Marie de y ROEGIERS, Xavier. 1995. Metodología para | 


LÓPEZ RUIPÉREZ, Francisco (Trad.). Madrid: La Muralla. pp. 18-22. 
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1.8. Contiene lista permutada de términos **, Debe entenderse, en 
tal caso, que generalmente los descriptores que se encuentran 
en las secciones alfabética y temática se presentan (junto con 
sus sinónimos) los descriptores y sus sinónimos ordenados 
alfabéticamente (considerando cada palabra clave o significativa). 

1.9. Contiene introducción y/o presentación *,**. En caso afirmativo, 
incluye información que permite el uso del tesauro (este aspecto 
es de gran utilidad). 

1.10. Origen de creación (a priori o a posteriori) **. Identifica si la 
concepción del tesauro fue previa a su aplicación a un universo 
documental o si se creó sobre la base de dicho universo. 

1.11. Contiene parte alfabética *. Analiza si los descriptores cuentan con 
relaciones completas o parciales. Se consideran completas cuando 
cuentan con relaciones jerárquicas, asociativas y de equivalencia. 

1.12. Contiene parte sistemática *. Determina si esta parte del tesauro 
cuenta con un esquema lógico de agrupación y criterios fijados 


para las relaciones entre los términos. 
1.13. Jerarquías *. Describe si las jerarquías de los tesauros son 


facetadas o por clases. 
1.14. Presentación jerárquica *. Describe si dicha presentación es 


por sangrías, grupos, flechas o combinaciones de estas formas. 


2. Elementos para el análisis de la consulta del tesauro 
2.1. Tipo de soporte **. Medio en el que se encuentra disponible el 


tesauro. 
2.2. Ilustraciones **. 


2.3.Se encuentra en líne 
2.4. Cuenta con guía de uso **, Este punto, al igual que la introducción 


o presentación, es de gran importancia ya que será la guía, la 
que nos permitirá hacer un mejor uso del tesauro. 
2.5. Copyright **. Fecha de copyright. 


a 


3. Consistencia de los descriptores del tesauro 
3.1. Presentan relaciones recíprocas *. Se refiere a la relación que 


los términos deben de mantener con los demás, sea cual sea 
aquella. Si no existe reciprocidad disminuyen las posibilidades 
de que, en la indización, se seleccionen los descriptores más 


adecuados. 
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3-2. Forma de los términos *. 
.A) Entrada directa. Construcción del 


natural de las palabras que lo co 
B) Sustantivos. Implica un ma 


término de aruerdo al', 
mponen. 

yor empleo de sustantivo 
sustantivas en la consirucción de lostesauros, - 
O Puntuación. Empleo de signos tales com 


so formas 


A E 


3.3. Uso de singular/plural *. Analiza el uso (normalizad 


singular y plural de acuerdo a la norma PNE - 50 106. 
3.4. Contiene descriptores en otro idioma *, 
3.5.Notas de aplicación o alcance ** 


sobre el uso de los descriptores 


9 0 no) del 


. Inclusión o no de aclaraciones 


4. Elementos para el análisis del contenido 
4.1. Cantidad de descriptores **. 
4.2.Cantidad de no-descriptores **. 

4.3. Cuenta con una lista jerárquica 
número máximo de jerarquías 

4.4. Nombres geográficos TE 

4.5. Nombres de instituciones **. 

4.6.Nombres de personas a 

4.7. Fechas **, 


(número de éstas)**. Describe el 
contempladas en los tesauros. 


+ Nota: Desde el punto 4.4 ha 


sta el 4.7 se analizará si se incluyen estas 
clases de descriptores en los tes 


auros. 


5. Estructura semántica del tesauro. 
- 5.1. Cantidad total de términos *. 
5:2.Incluye campos semánticos 
apartado la división temática 

en detalle la organización de | 
5-3-Notación utilizada para d 
términos. Identificación de | 


cada tesauro para designar 
descriptores. 


4 


(número)*. Se analiza en este 
del tesauro, es decir, se examina 
a terminología. 

esignar las relaciones entre 
as abreviaturas empleadas en 
las relaciones existentes entre 
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j án aquellos que se 
tesauros a analizar mediante el esquema anterior serán aq 
Los 


i os abordados, 
aspectos concret 
auro a construir o 
quen al tema del tes 
- enfoque 


f : ctualidad. El análisis de otros 
incluidos en la ana beta ome i posibilidad eaa 
ESA =S e a construir otro nuevo sino también para cotejar Aari 
uno preexistente y a de la temática que pudieran earar resue f 
de los aspectos pro conocerlos para comparar las categorías del n de 
ds ilares o comparar criterios terminológicos de uno y otr i 
generar con otros sed r que el análisis de tesauros con el objetivo de construi 
Es necesario an e da evaluar un tesauro y su funcionamiento. E 
PS i EE pe los dos tipos de evaluación para tomar la decisió 
quiere decir que se pa pero, en principio, es suficiente con la aplicación 
ee e Los objetivos de la evaluación en uno y otro A 
al ropa an lo nto se utiliza una metodología apropiada para ca 
P Lestelañteñor la valoración es directa sobre el tesauro 
tr ed e kaa del impacto en un sistema de información, ji 
cora o en la práctica. En general, cuando se dept 
dal a ro no existe el sistema de información sobre el a : 
A r a E E 
apa i ¡ os momentos en 
el ña ade a e esta distinción en la literatura 
tesauros no 
as luego de la clarificación de la Sl el o 
SN s establecer los objetivos 
le e o de un contexto específico. 
am 


H S pias RA A se x E E oo 
02 de su lectura 

E a E Aa Ri id a ai a R 

algun d de la lectura 

ARR p D E A A a is caracteristicas A nenes A 
rmas, E < ada 

ad e 

dos tesauros, 


plantearse: 


p ag 
297. AMAR, Muriel. Op. Cit. p. 34. 
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e Servir de t 7 
$ E O para indizar los documentos i 

a nado sistema de información y para recu ngresa 

el parte de los usuarios del mismo sistema A 

ograr una n TO | 

e ormalización de la terminología de la e la fra. 

S eterminado sistema de información Specialida 

oner j . | 

qe dd estructurado de términos sobre | 

a de c a 
temáticos que e oia aptos para organizar los pe de 
stan representados en determinado si enidos 
Sistema d 
e 


e Proponer un si j 
I . 
para guiar al els Jerarquizado de agrupamiento de la inf 
más general usuario y al indizador hacia núcleos más es Ri 
e e Í 
pa s del conocimiento especializado que ESOO 
n inado sistema de información se refleja en 
* Aclarar el signi i i 
Pene g ificado asignado a términos polísémicos en 
Me erminado sistema de información el contexto 
roponer un único térmi n i l 
S co têrmino para indizar entre los sinőni A 
a representar un concepto mos posibles 
e Difundir tod bee 
dos los posibles sinónimos del térmi 
como descriptor. ermino seleccionado 
* Recordar al usuari 
de a temas afines al descriptor buscado que tambié 
entados por otros descriptores en el sistema ambién 


Estos objeti 
ivos son los general 
defini A rales para tesauros y 
Inir los objetivos de un tesauro en particular. que servirán de base para 


6.4.3 
Metodología 
para desarrollar el t PEN 
de selección de los términos COS 


l El método apli 
E PEET i es para la planificación del tesauro es 
10 ya se en ta introducció 
ción del capít 
ulo. La 


a continuación di 
if 
Ganti erentes propuestas relativas a | 
ir el corpus terminológico a metodología para 


mación: 
d, 


eaman atn 
retrata hani neata. 
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6.43-1 Metodología para construir el corpus del tesauro 
La creación de un tesauro en una disciplina no es un 
fin en sí, sino un medio para procesar la información y luego acceder a ella 
con rapidez y eficacia. Como se ha visto en el punto anterior, se utiliza un 
tesauro para dar respuesta a tas búsquedas temáticas de los usuarios sobre 
un fondo documental especializado en algún área del conocimiento o en una 


base de datos que responda al interés de un grupo disciplinario. 

En la literatura sobre construcción de tesauros distinguimos dos áreas, la 
Terminología y la Lingüística, cuya aportación resulta imprescindible, como 
se puede observar en las obras de Wister?% y Cabré.2 Algunos autores 
añaden el punto de vista de la teoría del conocimiento, tal como Bingi, 


Khazanchi y Yadav?% y Ungváry.?* 
Estudiaremos las propuestas metodológicas de Lancaster, la de Aitchison 


y Gilchrist, y la de Currás, además de una experiencia práctica como la 
construcción del tesauro EUROVOC enfocadas desde la Bibliotecología. Las 
tres primeras fueron escogidas por ser las más citadas en nuestro medio por 
especialistas en lenguajes documentales, y la última por ser una experiencia 
de trabajo útil para contrastar con las metodologías teóricas. 

En principio, podemos distinguir algunas etapas comunes en las dos 
principales propuestas metodológicas expuestas: definición del campo de 
trabajo, recolección, normalización, organización de los términos y evaluación 


302 


del tesauro. 
En cuanto a la definición del campo de trabajo, Aitchison y Gilchrist 


proponen analizar perfectamente el entorno de uso del tesauro, ubicar la 
temática, definir el tipo de tesauro y difundir la decisión de construir el 
tesauro, para contar con el auxilio de otros especialistas quienes podrán 


298. WÚSTER, Euge 
terminológica. CABRE, María Teresa 


299. CABRÉ, María Teresa. 1999. 
representación y comunicación: elementos para una teor. 


Barcelona: JULA. p. 238. 

300. BINGI, R., Deepak KHAZANCH! y Surya B. YADAV. 1995. 
analysis and evaluation of knowledge representation schemes 
Management, vol. 31, N? 2. p. 235. 

301. U NGVÁRY, Rudolf. 1983. “Application ofthe Thesaurus me 


» En: International Classification, vol. 10, N° 2. p. 64. 
ILCHRIST, Alan. 1987. Thesaurus construction: a 


(Ed.). Barcelona: IULA. p. 147. 
“Terminología y documentación” 


edge 
302. AITCHISON, Jean y G 


London: ASLIB. p. 121. 





n. 1998. Introducción a la teoría general de la terminología y a la lexicografía 


. En su: La terminología: 
fa de base comunicativa y otros artículos. 


“A framework for the comparative 
» En: Information Processing & 


thod to the communication of knowl- 


practical manual. 2? ed. 





q ED 
; TA 


informar sobre experiencias relacionadas 
K de trabajos paralelos. Hia 
ancastera ¡nsi ietá 
O NA me de los tesauros construidos en el 4 
E e ai E finalidad de darles una mejor aa 
ee de traducir alguno o O analizar la 
aii as idioma. 
de o nuevo sólo cuando se ha E 
Currás advierte e des Ed a 
gea ea que no exista algún tesauro sobre el tem 
adaptación a nuestro caso particul T los campos del saber cubiertos Pe aen 
IR EE ce ar implica partir de cero. Tenemos que pd E 
Tanto Lancaster? como pra prestado aquello que se nos ofrece” ia 
de los dos métodos siguientes Ison y Gilchrist2os proponen utilizar cualqui 
E E para construir tesauros: el deductivo y el ind 3 
erminos generales en la definición de los o 
S: 


a plantearse 
posibilidad 


` a 
El método deductivo con frecuencia im 
n en su elaboración 
. +A ». e ; 
pais inductivo o empírico utiliza los mé 
para recolectar los términos del corpus 


plica la participación de 


todos de la terminología 


O por especialistas del campo 
s en información. 


303. LANCASTER, F, Wilfrid. 1 


85. Th 7 
UNESCO, p. 10. 985. Thesaurus construction and use a condensed course. P 
rse. París: 


304. CURRÁS, Emilia. 19 
305. Ibid. p. 10, 
306. Ibid. p. 121. 


Y 
3 


el proyecto y asegurarán da 
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uctura del tesauro y aportarán los puntos de 


vista tanto de los indizadores como de tos usuarios del sistema de información. 

El método inductivo o empírico para construir tesauros es el extremo 
opuesto y mucho más seguro. Los términos encontrados en el campo de 
interés se reúnen desde varias fuentes y las categorías O jerarquías de términos 


se van formando a través del uso. 
En general, los últimos autores que han tratado el tema coinciden en 


zación de los dos métodos para construir el tesauro. Como 
“existe la posibilidad de combinar ambos 
n mixto, que suma las ventajas 


permite asegurar la creación de 


información organizarán la estr 


proponer la utili 
resume muy bien Gil Urdiciain: 
procedimientos en el método de recopilació 
de los procedimientos analítico y sintético y 


una sola base metodológica”. 
Un ejemplo de construcción con base en el método deductivo lo explica 


Maciá en un trabajo sobre el método de mantenimiento y control del 
tesauro EUROVOC y la creación de su estructura de gestión. El tesauro EUROVOC, 
construido para el intercambio de información de las actividades comunitarias 
de la Europa unificada, es multidisciplinario porque está destinado a cubrir la 
actividad parlamentaria, tanto de las instituciones comunitarias como de los 
estados miembros, relacionadas con el trabajo común. 

En efecto, el tesauro EUROVOC es multilingüe y participan varias 
instituciones en su construcción. Por lo tanto, la metodología de trabajo 
debe ser muy clara y organizada con una estructura flexible para dar cabida 
a todos los interesados, pero al mismo tiempo determinante en el aspecto 


del control de las decisiones. 


La gestión del EUROVOC —afirma Maciá- la llevan a cabo tres Órganos: 


e El Comité Director, que toma las decisiones sobre la evolución del tesauro. 


e La Unidad de Mantenimiento, que ejecuta las operaciones intelectuales de actualización 
los 


e El Comité de Usuarios es un Órgano consultivo en el que están representados todos 


usuarios del tesauro. Sus 


el mayor número posible de usuarios, coordinar las diferentes propuestas en contacto 


unidad de mantenimiento y valorar la repercusión de las actualizaciones 


307. GIL URDICIAIN, Blanca. 1996. Manual de lenguajes documentales. Madrid: Noesis. p. 207. 


308. MACIÁ, Marco. 1995. “El tesauro EUROVOC”. 
Documentación, vol. 5, N° 2. p. 275. 
309. Ibid. 








objetivos son hacer evolucionar EUROVOC de modo que satisfaga 
con la 


sobre los fondos.3® 


En: Revista General de Información y 
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a) La recolección de los términos 


Aitchison y Gilchrist, a di j 
t, a diferencia de Lancaster, proponen co 


s en cualquiera de los dos métodos 
para distribuirlos en a o una cantidad suficiente 
; : ortas. Subr R 
inductivo porqu EE ayan una vent 
e los términos aja en 
¡ i ue se van d 
inmediatamente q etectando $ 
, au z , pueden 
nque después de terminada la construcción d a 
el tesaur 
o 


se requerirá una revisió l 

isiôn de la indizació 

> ción cuando el signi 

usados pueda apreciarse ioi, el significado de los términos 


Para desarrollar el tesauro a partir del mé 
caster identifica dos principios E 
a principio de garantía literaria jiega 

porque un término candidato sólo se ¡ 
sobre el tema con cierta frecuencia | 


pero en el 
de términos 
el método 


deductivo se detienen des 


todo empírico o inductivo, Lan- 
garantía literaria y garantía de 
un papel fundamental en este 
ustifica si aparece en la literatura 


minos, siempre 
a pre y cuando estas fuentes estén razonabl í 
985, Lancaster mencionaba pu les 


a la 
tér 


laa a de términos útiles. 
la orma manual es tediosa y consume 
ds o cuando el resumen es legible por 
la di para manipularlo. En este caso 
Penis oa j as palabras significativas de los 
T e elaborar frecuencias de aparición 
ítulos ofrecen palabras significativas: unas 


Según Lancaster, 
mucho tiempo; afirm 
computadora y trans 
pueden usarse prog 
títulos y los resúmen 
de las mismas. No s 


310. lbid., pp. 121-143. 
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están mal redactados; otros, escritos con alegorías que no 
Otro problema es la ausencia de recuperación de términos 
corapuestos, ya que los programas sólo extraen términos simples. 

- Para Aitchison y Gilchrist la selección de los términos está dividida en dos 
grandes áreas: los escritos y no escritos. En el ámbito de los escritos, proponen 
utilizar las fuentes terminológicas, las revisiones de la literatura y las preguntas 


ayudan para este fin. 





de los usuarios al sistema. Sin embargo, los autores observan que los sistemas 
de revisión en las bases de datos de texto completo o bibliotecas digitales 
necesitan cumplir con ciertos requisitos, como la presencia de publicaciones 
de diferente tipo, que aseguren la cobertura de la parte teórica y práctica de 
una disciplina. 

En este sentido, Aitchison y Gilchrist advierten que aun cuando se disponga 
de una base de datos de texto completo, no tendremos una garantía muy 
adecuada para recolectar términos, si no estamos seguros que en esa base 
están incluidos todo tipo de material que recopile información en la temática 








del tesauro. No podemos hacer, pues, la recolección de términos extrayéndolos 
únicamente de artículos de investigación o libros teóricos porque pueden quedar 
fuera muchos términos que pertenecen al ámbito técnico o industrial y que el 
sistema requiere para completar el conjunto terminológico de una disciplina. 

En definitiva, el sistema de información sobre el que se trabaja debe 
contener, además de libros y revistas, otros tipos de materiales tales como: 
informes, panfletos, catálogos de productos, conferencias, especificaciones 
de patentes, normas, etcétera. 

En consecuencia, es bueno utilizar desde la literatura más científica a la 
más técnica, sobre la cual se pueden aplicar programas de cómputo para 
buscar los términos significativos de una disciplina que ayudarán en la 
recopilación. La diversificación del tipo de literatura es una sugerencia adecuada 
que se debe tener presente cuando se realice la recolección de términos. 

En cuanto a los términos “no escritos” Aitchison y Gilchrist opinan que se 
tendrán en cuenta los términos sugeridos principalmente por los expertos, 
productores y usuarios del sistema. 

Lancaster advierte que los términos seleccionados en la literatura son 
importantes, pero también es cierto que esos términos deben representar los 
intereses de los usuarios, plasmados por medio de una demanda formulada 
en el sistema de información donde se aplicará el tesauro. Ciertos términos 
pueden estar en la literatura, pero ser de poco interés en un grupo particular 
de usuarios. Puede necesitarse determinado tipo de términos muy específicos 
y con características especiales del núcleo usuario del sistema de información. 
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nte 


de términos. L i 

. Los usuarios tambié 
RES n pueden ármi Po 
publicaciones de su interés P subrayar terminos: basicos de las 


e 
P l i recolección de los términos, se o ¡ 
UNESCO en a a a E EN AaS a 
aa Ea sauros monolingües e incorporadas a las E 
NE BE , publicadas en 1974, 1981 y 1986. Las normas ES 
1983 a las normas ISO Ds o En 1979 Y 1979 Te E 
la traducción de la norma 2 y A en 1985. En el español se he 
para el establecimient ; OP” 106 “Directri j 
aprobadas el 2 “juli i e AA nacionales ameri 
and ds 2005 “Guidelines for the Construction a 
resolver«atgunas*de las as a Vocabularies” porque  yudan a 
ear e de revisión, a acid 
AA inductivo, una vez recolectad Si 
haber norm ; e ctados los términos a 
a e de términos candidatos, se deben oe 
categorías se B e prep y en jerarquías; dentro de P 
después de P interjerârquicas. Para el método deducti 
A E es términos se van ordenando en las pS 
sistemática será vertida idad. En cualquiera de los dos casos, la estruct E 
Las relaciones jerár le oa en el corpus del tesauro li 
de superioridad y d q caa, genericas y partitivas, expresan las rel E 
y de subordinación entre los términos. En las ao 
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de manera implícita los 


término superior es UN concepto que contiene 
s. Cada una de las partitivas 


conceptos que representan a los términos específico 
se convierte en genérica del nivel inferior y así sucesivamente. 

Respecto a la presentación del tesauro por campos temáticos agrupados 
en jerarquías, dice Gil Urdiciain que “los descriptores S€ presentan en esquemas 
arborescentes, con ramificaciones sucesivas sin que, €n ocasiones, exista un 
rigor lógico en su estructura, lo que se justifica en el seno de este lenguaje 
documental por razones pragmáticas”.?" 

Cada término que se convierte en descriptor deberá ir, por tanto, 
acompañado de las expresiones de término genérico y términos específicos, 
es decir, relación parte-todo. Una relación parte-todo es una relación biunivoca, 
ya que a una categoría corresponden varios términos asociados a ella. En 
términos generales Se acostumbra reconocer hasta tres niveles de profundidad 
en las categorías; sin embargo, en cada caso se deberá llegar hasta el nivel 


exigido por la ciencia o técnica implicada. 


A) Análisis de las propuestas metodológicas Y de evaluación de tesauros 
A partir del estudio de las diferentes propuestas metodológicas para 
construir tesauros, S€ ha podido apreciar poca preocupación por el empleo 
de sistemas generales de clasificación de las ciencias, en contraposición a las 


necesidades que está señalando el mercado actual de la información, 
principalmente cuando se utilizan nuevas técnic 


sistemas de inteligencia artificia 
recuperar, una vía de enfoque consis 
de tas disciplinas y sobre el particular no abunda la bi 
punto digno de estudio, pero itama la atenció 
ha dado al tema en la bibliografía sobre la construcción de tesauros. 
Una vez construido el esquema concep 
descriptores 5€ vierten, cada uno en una 
comparación de estas hojas que notamos una evolución en 


construcción de tesauros. LOS modelos de hojas recientes inc 


ta frecuencia de la palabra en los textos, además de que los paquetes de 
para manejar tesauros asignan un campo específico para esta variable. 


tiía en contar con los mapas concep 
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los métodos de 
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Van Slipe>'* y Chaumier?” estudian cómo se comporta un tesauro desde 


de vista estadístico mientras está en funcionamiento para realizar su 
idente la falta de una visión integral del 


Se han hecho propuestas de mediciones cuantitativas sobre las 
dan las relaciones de los términos, pero Lancaster les 


que si bien resultan ingeniosas, considera triviales 


los valores que se le asignan a las 


resta importancia, por 
puede 


algunas de ellas, y sobre todo opina que 
mediciones parecen arbitrarias. La opinión de Lancaster es que se 
evaluar un tesauro sólo a partir del uso real que se haga del mismo. “La 

existencia de términos suficientemente 


prueba definitiva nos la dará la 
específicos para representar adecuadamente la materia de los documentos y 


do de ambigiledad sintáctica en la base de datos y la 


las peticiones, el gra 
dos los términos necesarios para realizar 


utilidad del tesauro para encontrar to 
una búsqueda concreta”.** 
García Jiménez hace un estudio pormenorizado de las 


evaluación de tesauros y elabora la suya propia. Lo interesante de su aportación 
es el detalle de los indicadores de calidad de: Van Slype; Lancaster; Álvaro, 
Villagrá y Sorli; Cunha, López-Aranguren, Aitchison y Gilchrist; García Gutiérrez 


propuestas de 


y San Segundo.?” 


d) Método híbrido para construir un corpus 
El método recomendado para construir el corpus del tesauro es la 


combinación del método inductivo y el deductivo. De acuerdo a esta propuesta 





se trata de obtener un listado previo de términos candidatos y una estructura 
jerárquica básica para agrupar los términos en las categorías principales y de 
ahí extraer clases y las siguientes subclases. La construcción del corpus 
comprende actividades que corresponden en su gran mayoría a esta primera 


etapa de recolección, pero también a la conceptual: 


eorges Van. 1991. Los lenguajes de indización: concepción, construcción y utilización 
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documentales: el tratamiento lingüístico de la 


tión del conocimiento en la comunicación. 
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i Dici i 
iseño de una estrategia de búsqueda de fuentes para la 


La existencia de políticas de selección de los términos facilitará la 
consistencia del tesauro, ya que se unificarán las decisiones sobre la 
corveniencia de preferir un término sobre otro. En apartados posteriores se 
insistirá sobre el tema de la solidez en los criterios selectivos de los términos. ri 

La creación de un comité de consulta integrado por especialistas en los 


terminolós; E 10 
f e y elaboración de un list ias 
: \ná Isis de tesauros, vocabularios 
sistemas de clasificación sobre la tem 


oe 59D SUL Orespordiente referencia 


ado. 
controlados, termin 
atica y extracción de t 





ologfas, 
€rminos, 





se iran acumulando en un archi 





3. Diseño de una estrategi ú i | 


utilización de cada una de ellas 
10. Elección de un software : 
tesauro y revisar la consi 
tipo de normatividad 
oferta disponible al 


Bo e desarrollar la estructura del 
cia de las relacione 
S. La elección d 
el 
y software están estrechamente ligadas por la 


i i para d 
implicado. Iscuttr con todo el equipo de trabajo 
12. €l traslado de los r 
esultado 
elegido s de la terminología obtenida al soporte 
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o especial, 





campos semánticos y jerarquías de conocimiento es una ayuda necesaria 
para desarrollar el proyecto. Es importante, además, difundir la decisión de 
construir el tesauro para contar con el auxilio de otros especialistas que 
hubieran tenido experiencias relacionadas con el proyecto, y para asegurar la 


inexistencia de trabajos paralelos. 


6.4.4 Selección del software para manejar el tesauro 

En general, los sistemas de información incluyen un 
módulo para ingresar tesauros, cuando no se cuenta con un programa de 
este tipo, la solución es comprar uno de bajo costo, pero efectivo para soportar 
la construcción del tesauro en forma autónoma. En materia computacional se 
analizaron varios programas ofrecidos en el mercado para la construcción del 
tesauro. En primer lugar, se solicitó a la Organización de Cooperación y 
Desarrollo Económico (OCDE), con sede en París, el programa Sistema de 
Gestión de Tesauro Multilingüe y de Búsqueda de Términos Versión 3.1, con 
la versión en español del manual (realizado por Ána María Pastor), que se 
otorga a instituciones educativas de todo el mundo en forma gratuita. La 
última versión que no fue la revisada es MTM versión 3.0. 

Este sistema es el que sustenta el Macrothesaurus para el Procesamiento 
de la Información relativa al Desarrollo Económico y Social, que es uno de los 
tesauros mejor construidos, usado en muchas bibliotecas del mundo. Después 
de realizar pruebas con el programa, se observaron algunos inconvenientes 
que presenta para su uso. La primera y más importante es que no alfabetiza 
los términos en español y esto es un problema cuando se quiere publicar una 
versión impresa. Los registros de no-descriptor O términos no preferidos no 
son multilingües: sólo contienen un término principal y un descriptor en un 
idioma. Los registros de no-descriptor tienen que ser creados para cada idioma 
por separado. Otro de los problemas es que está escrito en Pascal CDS/ISIS, 
lenguaje cuyo manejo requiere de conocimientos especiales porque ha 
incorporado varios subprogramas posteriores al diseño inicial que no aseguran 
un funcionamiento consistente y dificultan la adecuación para fines particulares. 
La presentación es poco clara para personas no familiarizadas con el 


procesamiento de información. 








